\chapter{动态面板阈值模型的梳理}
	\section{动态面板模型}
	\subsection{动态面板估计的困难与动机}
对于一个伴随一阶滞后的动态面板模型如下，
\begin{equation}\label{eq1}
 y_{it}=\delta y_{i,t-1}+x'_{it}\beta + u_{it}\qquad i = 1,\cdots,N; t= 1,\cdots,T 
\end{equation}


其中，$ \delta $是标量，$ x'_{it} $是$ 1\times K,\beta $是$ K\times 1 $。误差项遵循，
\[ u_{it}= \mu_i + \nu_{it} \qquad \mu_i\sim i.i.d. (0,\sigma_\mu^2),\nu_{it}\sim i.i.d. (0,\sigma^2_\nu)\]

根据\eqref{eq1}式，$ y_{it} $是$ \mu_{i} $的函数，那么将\eqref{eq1}式滞后一期发现$ y_{it-1} $也是$ \mu_i $的函数。那么再回到\eqref{eq1}式，就可以看到$ y_{it-1} $就是内生的了。此时考查组内估计：\textbf{滞后因变量的组内变换$ y_{i,t-1}-\bar y_{i.-1}$，其中$ \bar y_{i.-1}=\sum_{t=2}^{T}y_{i,t-1}/(T-1) $。由于$ y_{i,t-1} $与$ \nu_{it-1} $相关，从而与$ \bar\nu_{i.} $相关，因此，滞后因变量的组内变换仍然与$ (\nu_{it}-\bar\nu_{i.}) $相关。}
\subsection{Arellano and Bond 估计量}
如果此时转向一阶差分估计，
\[(y_{it}-y_{it-1})=\delta(y_{it-1}-y_{it-2}) + (\nu_{it}-\nu_{t-1}) \]

对于3期的面板，第1期就可以写为，
\[ y_{i3}-y_{i2}=\delta(y_{i2}-y_{i1}) + (\nu_{i3}-\nu_{i2}) \]

此时，$ y_{i1} $就是一个有效的工具变量，因为它高度相关于自变量$ y_{i2}-y_{i1} $且不相关与$ (\nu_{i3}-\nu_{i2}) $。对于4期的面板，其第2期可以写作，
\[ y_{i4}-y_{i3}=\delta(y_{i3}-y_{i2}) + (\nu_{i4}-\nu_{i3}) \]

此时$ y_{i2},y_{i1} $都是$(y_{i3}-y_{i2})  $的有效工具变量。因此，如果定义工具变量矩阵，
\[ W_i=\underbrace{\begin{pmatrix}
[y_{i1}]& 0 &\cdots &0 \\
0&[y_{i1},y_{i2}]& \cdots &0 \\
\vdots&\vdots& \ddots &\vdots \\
0&0&0&[y_{i1},y_{i2},\cdots,y_{iT-2}]
\end{pmatrix}}_{T\times (1+2+\cdots+(T-2))} \]

那么矩条件为$ E(W'_i\Delta\nu_i)=0 $。可以写为，
\[ E(W'_i\Delta\nu_i)=\begin{pmatrix}
	(y_{i1})& 0 &\cdots &0 \\
	0&\begin{pmatrix}
	y_{i1}\\y_{i2}
	\end{pmatrix}& \cdots &0 \\
	\vdots&\vdots& \ddots &\vdots \\
	0&0&0&\begin{pmatrix}
	y_{i1}\\ y_{i2}\\ \cdots\\ y_{iT-2}
	\end{pmatrix}
	\end{pmatrix}\begin{pmatrix}
	\Delta \nu_{i1}\\
		\Delta \nu_{i2}\\
		\vdots\\
			\Delta \nu_{iT}\\
	\end{pmatrix}=0 \]

进一步地，这可以通过对回归方程左乘工具变量矩阵，然后进行广义最小二乘法得到$ \hat\delta $。
\subsection{Arellano and Bover 估计量}
从一个统一的GMM框架推导至动态面板的估计。
\subsubsection{统一的GMM估计框架}
先考察静态形式的表述，
\[ y_{it}=\bm{x}'_{it}\bm{\beta} + \bm{Z}'_i\bm{\gamma} +u_{it} \]

其中$ \bm{\beta} $是$ K\times 1 $,$\bm{\gamma} $是$ g\times 1 $。将其写成向量形式，
\begin{equation}\label{bover1}
 \bm{y}_i=\bm{W}_i\bm{\eta} + \bm{u}_i
\end{equation}


或者，更清晰的，
\[ \begin{pmatrix}
y_{i1}\\ y_{i2}\\ \vdots \\y_{iT}
\end{pmatrix} =\begin{pmatrix}
\bm{x}'_{i1} & \bm{Z}'_i\\ \bm{x}'_{i2} & \bm{Z}'_i\\ \vdots \\\bm{x}'_{iT}& \bm{Z}'_i
\end{pmatrix}\begin{pmatrix}
\bm{\beta}\\\bm{\gamma}
\end{pmatrix} + \begin{pmatrix}
\mu_{i} + \nu_{i1}\\\mu_{i}+ \nu_{i2}\\\vdots\\\mu_{i}+ \nu_{iT}
\end{pmatrix}\]

此时对上述T个方程的系统进行一个如下变换，
\[ \bm{H}=\begin{pmatrix}
\bm{C}\\ \bm{\ell}'_T/T
\end{pmatrix} \]

其中$ \bm{C} $可以是任何满足$ \bm{C\ell}_T=0 $的$ (T-1)\times T $的秩为$ T-1 $的矩阵。譬如$ \bm{C} $可以是前面$ T-1 $行的组内运算子或者一阶差分算子。注意到这种变换后的扰动为，
\[ \bm{u}_i^+=\bm{Hu}_i=\begin{pmatrix}
\bm{Cu}_i\\ \bar{\bm{u}}_i
\end{pmatrix} \]

因此，前面$ T-1 $行就会消去固定效应$ \mu_i $。因此，所有的外生变量都是前面$ T-1 $个方程的有效工具变量。譬如，$ \bm{w}_i=(\bm{x}'_{i1},\bm{x}'_{i2},\cdots,\bm{x}'_{iT},\bm{Z}'_i) $就是前面T-1个方程中任一个方程的有效工具变量集。若令$ \bm{m}_i $表示$ \bm{W}_i $中水平值与固定效应$ \mu_i $无关的变量集，且其维数大于$ \bm{\eta} $的维数，那么，整个左乘$ \bm{H} $后的系统的有效工具变量矩阵为，
\[ \bm{M}_i = \begin{pmatrix}
\bm{w}'_i &0 &0&0\\
0&\bm{w}'_i &0 &0\\
\vdots&\vdots&\ddots &\vdots\\
0&0&0&\bm{m}'_i
\end{pmatrix} \]

矩条件为，
\[ E(\bm{M}'_i\bm{Hu}_i)=0 \]

有了矩条件就可以得到工具变量估计量。现在，具体来看数据矩阵的堆叠及计算过程。
\begin{enumerate}
	\item 首先，将个体的各时期数据依次往下接，形成,
	\[  \bm{y}=\bm{W\eta} + \bm{u} \]
	其中，$ \bm{y}=(\bm{y}'_1,\bm{y}'_2,\cdots,\bm{y}'_N)',\bm{W}=(\bm{W}'_1,\bm{W}'_2,\cdots,\bm{W}'_N) $。
	\item 因为要每个个体要进行组内变化，所以要使用克罗内克积,把变换矩阵$ \bm{H} $分块，即$ \bar{\bm{H}}=\bm{I}_N\otimes \bm{H} $后，再左乘上式。得到，
	\[  \bar{\bm{H}}\bm{y}=\bar{\bm{H}}\bm{W\eta} + \bar{\bm{H}}\bm{u} \]
	这就是进行变化以后的数据矩阵了。
	\item 然后，构造全样本的工具变量集，$ \bm{M}=(\bm{M}'_1,\cdots,\bm{M}'_N)' $,将其转置后左乘上述方程，得到，
	\begin{equation}\label{bover2}
	  \bm{M}'\bar{\bm{H}}\bm{y}=\bm{M}'\bar{\bm{H}}\bm{W\eta} + \bm{M}'\bar{\bm{H}}\bm{u}
	\end{equation}	
	对上述方程进行GLS即可。这也是2SLS估计量，也称为Arellano and Bover (1995)的估计量。
\end{enumerate}
\subsubsection{到动态面板的推广}
只要找到合适的工具变量，直接对\eqref{bover2}式进行GLS即可。
\subsection{Blundell and Bond 的系统GMM估计量}
Blundell and Bond (1998)表明一阶差分GMM估计量在小样本情况下，效率较低，还存在一定的偏倚。如果对初始条件施加弱平稳性约束，即，
\[ E\left[\left(y_{i1}-\frac{\mu_i}{1-\delta}\right)\mu_i\right]=0 \]

可以使得所有个体$ y_{it} $从第2期开始收敛于均值$ \frac{\mu_i}{1-\delta} $。这样就能得到$ E(\Delta y_{i,t-1}\mu_i)=0 $，然后再利用通常的假设条件$ E(\Delta \nu_{it}\mu_i)=0, \; t = 3,\cdots,T $，就有了新的矩条件，
\[ E[\Delta y_{i,t-1}(\mu_i+\nu_{it})]=0, \;\; t = 3,4,\cdots,T\]

这其实是将$ y_{it} $的滞后差分项作为水平方程的工具变量。然后再加上前面的Arrellano and Bond估计量的工具变量一起估计，就可以得到一个新的估计量，叫做系统GMM估计量。该估计量改进了精度，减少了偏倚。
\section{动态面板阈值回归（Seo and Shin, 2016）}
\subsection{模型表述}
考虑如下一个动态面板阈值回归模型，
\[ y_{it} = (1,\bm{x}'_{it})\phi_1\bm{I}\{q_{it}\le \gamma\} + (1,\bm{x}'_{it})\phi_2I\{q_{it}> \gamma\} + \varepsilon_{it}\]

其中，$ \bm{x}_{it} $是$ k_1\times 1 $的回归向量，且包含滞后因变量。普通的固定效应估计会带来向下的偏误(Nickell, 1981)，因此，借鉴Arellano and Bond (1991)进行一阶差分转换，
\begin{equation}\label{ss1}
 \Delta y_{it} = \beta'\Delta \bm{x}_{it} + \delta'\bm{X}'_{it}\bm{I}_{it}(\gamma) + \Delta\varepsilon_{it}
\end{equation}


其中，
\begin{align*}
\underset{k_1\times 1}{\beta} &= (\phi_{12},\phi_{13},\cdots,\phi_{1,k_1+1})\\
\underset{(k_1+1)\times 1}{\delta}&=\phi_2-\phi_1\\
\bm{I}_{it}(\gamma)&=\begin{pmatrix}
1\{q_{it}>\gamma\}\\
-1\{q_{i,t-1}>\gamma\}
\end{pmatrix}\\
\bm{X}_{it} &= \begin{pmatrix}
1 & \bm{x}'_{it}\\
1 & \bm{x}'_{it-1}
\end{pmatrix}
\end{align*}
为看得更清楚些，可以展开写成，
\begin{align*}
\Delta y_{it} & = (\phi_{12},\phi_{13},\cdots,\phi_{1,k_1+1})\underset{k_1\times 1}{\Delta \bm{x}'_{it}} + \underset{1\times (k_1+1)}{(\phi_2-\phi_1)'}\begin{pmatrix}
1 & 1\\
\bm{x}_{it}&\bm{x}_{i,t-1}
\end{pmatrix}\begin{pmatrix}
1\{q_{it}>\gamma\}\\
-1\{q_{i,t-1}>\gamma\}
\end{pmatrix}+ \Delta\varepsilon_{it}\\
& = (\phi_{12},\phi_{13},\cdots,\phi_{1,k_1+1})\underset{k_1\times 1}{\Delta \bm{x}'_{it}} + \begin{bmatrix}
(\phi_2-\phi_1)'\begin{pmatrix}
1 \\ \bm{x}_{it}
\end{pmatrix} & (\phi_2-\phi_1)'\begin{pmatrix}
1 \\ \bm{x}_{it-1}
\end{pmatrix}
\end{bmatrix}\begin{pmatrix}
1\{q_{it}>\gamma\}\\
-1\{q_{i,t-1}>\gamma\}
\end{pmatrix}+ \Delta\varepsilon_{it}\\
& = (\phi_{12},\phi_{13},\cdots,\phi_{1,k_1+1})\underset{k_1\times 1}{\Delta \bm{x}'_{it}} + 
(\phi_2-\phi_1)'\begin{pmatrix}
1 \\ \bm{x}_{it}
\end{pmatrix}1\{q_{it}>\gamma\} - (\phi_2-\phi_1)'\begin{pmatrix}
1 \\ \bm{x}_{it-1}
\end{pmatrix}1\{q_{i,t-1}>\gamma\}
+ \Delta\varepsilon_{it}
\end{align*}

然后分四种情况代入，可以看到\eqref{ss1}式是一个绝妙的通用表述。
\begin{align*}
(\phi_{12},\phi_{13},\cdots,\phi_{1,k_1+1})\Delta \bm{x}_{it}, \qquad I(q_{it}\le \gamma), I(q_{it-1}\le \gamma)\\
(1,\bm{x}'_{it})\phi_2-(1,\bm{x}'_{it})\phi_1, \qquad I(q_{it}> \gamma), I(q_{it-1}\le \gamma)\\
(1,\bm{x}'_{it})\phi_1-(1,\bm{x}'_{it})\phi_2, \qquad I(q_{it}\le \gamma), I(q_{it-1}> \gamma)\\
(\phi_{22},\phi_{23},\cdots,\phi_{2,k_1+1})\Delta \bm{x}_{it}, \qquad I(q_{it}> \gamma), I(q_{it-1}> \gamma)\\
\end{align*}
\subsection{估计}
本质上得到\eqref{ss1}式后，找到相应的工具变量不断更换阈值$ \gamma $，直接进行GMM估计。但作者给出了详细的计算过程如下。

对转换后的模型直接OLS会有偏误。需要找一个$ l\times 1 $工具变量向量$ (\bm{z}'_{it_0},\cdots,\bm{z}'_{iT})', 2<t_0\le T $，且$ l\ge k $。矩条件为，
\[ E(\bm{z}'_{it_0}\Delta \varepsilon_{it_0},\cdots,\bm{z}'_{iT}\Delta \varepsilon_{iT})'=0 \]

注意到$ \bm{z}'_{it} $类似于Arellano and Bond (1991)可以包含$ (x_{it},q_{it}) $的滞后值，可以包含因变量的滞后值，并且每期不同。于是，可以构造样本矩如下，
\[\underset{l\times 1}{g_i(\theta)}=\begin{pmatrix}
z_{it_0}(\Delta y_{it_0} -\beta'\Delta \bm{x}_{it_0} - \delta'\bm{X}'_{it_0}\bm{I}_{it_0}(\gamma) )\\
\vdots\\
z_{iT}(\Delta y_{iT} -\beta'\Delta \bm{x}_{iT} - \delta'\bm{X}'_{iT}\bm{I}_{iT}(\gamma) )
\end{pmatrix} \]

做GMM时，可以先在个体维度上求平均，
\[ \bar{g}_n(\theta)=\frac{1}{n}\sum_{i=1}^ng_i(\theta) \]

然后最小化下式即可，
\[ \bar{J}_n(\theta)=\bar{g}'_n(\theta)W_n\bar{g}_n(\theta) \]

这种方式等价于我们前面那种左乘工具变量矩阵再GLS。作者为了得到解析表达，进一步进行了分析，其将$ g_i(\theta) $分成两部分，
\[ \underset{l\times 1}{g_{1i}}= \begin{pmatrix}
z_{it_0}\Delta y_{it_0}\\
\vdots\\
z_{iT}\Delta y_{iT}
\end{pmatrix},
\underset{l\times (k-1)}{g_{2i}(\gamma)}=\begin{pmatrix}
z_{it_0}[\Delta x_{it_0},\bm{I}_{it_0}(\gamma)'\bm{X}_{it_0}]\\
\vdots\\
z_{iT}[\Delta x_{iT},\bm{I}_{iT}(\gamma)'\bm{X}_{iT}]
\end{pmatrix} \]

那么，其个体维度上的平均为，
\[ \bar{g}_{1n}= \frac{1}{n}\sum_{i=1}^{n}g_{1i}, \bar{g}_{2n}=\frac{1}{n}\sum_{i=1}^ng_{2i}(\gamma)\]

那么给定$ \gamma $, 参数的估计为，
\[ [\hat\beta(\gamma)',\hat{\delta}(\gamma)']'=[\bar{g}_{2n}(\gamma)'W_n\bar{g}_{2n}(\gamma)]^{-1}\bar{g}_{2n}(\gamma)'W_n\bar{g}_{1n}(\gamma) \]
